Etude de l'impact du regroupement automatique de phrases sur un système de résumé multi-documents
نویسندگان
چکیده
RÉSUMÉ. Dans cet article, nous comparons les résultats produits par différentes approches de résumé multi-documents. Nous opposons deux approches classiques à la nôtre qui place la modélisation de la diversité informationnelle du corpus au centre du processus. Nous évaluons également l’impact de différentes mesures de similarité entre phrases. Les expériences, menées sur le corpus RPM2, montrent qu’un regroupement des phrases en classes sémantiques améliore la qualité des résumés.
منابع مشابه
Séro-neutralisation de sous-types A de virus aphteux sur un système cellulaire. Etablissement des relations liant le titre du sérum au titre du virus
متن کامل
Regroupements non-disjoints de mots pour la classification de documents
RÉSUMÉ. La classification automatique de documents est un domaine d’étude en plein essor dans le domaine du Traitement et de la Recherche d’Information (RI). Dans un cadre supervisé, il s’agit alors d’entraîner un modèle de classifieur sur un corpus de documents étiquetés. La difficulté majeure consiste à représenter les documents par un nombre limité et suffisant d’attributs. Dans cet article,...
متن کاملFiltrage de textes dans le but de produire un résumé de documents multiples
RÉSUMÉ. Dans le cadre de la conférence d’évaluation DUC, nous avons développé un système de résumé automatique de documents multiples qui se base sur l’extraction des phrases clés. La méthode proposée utilise un algorithme génétique qui permet de combiner les phrases des documents sources pour former les extraits, qui seront croisés et mutés pour générer de nouveaux extraits. L’examen des résul...
متن کاملGISMatch : un système d'appariement automatique de schémas géographiques
RÉSUMÉ. Dans un système de médiation, les utilisateurs posent leurs requêtes sur un schéma global. Ces requêtes sont traduites en termes des sources locales, grâce à une réécriture qui utilise un ensemble de règles de correspondances. L’un des principaux problèmes de ces approches consiste à définir, d’une façon (semi-)automatique, les correspondances sémantiques entre les éléments du schéma gl...
متن کاملLecture Séquentielle de Documents pour la Classification
RÉSUMÉ. Nous proposons un nouveau modèle de lecture séquentielle permettant la classification automatique de documents textuels. Il est basé sur la modélisation d’un agent qui lit un document phrases après phrases et qui peut à tout moment décider d’associer un document à une ou plusieurs catégories données. L’algorithme proposé se base sur une formalisation de la classification de texte en tan...
متن کامل